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摘 要 : 


[目的 /意义 ] 调查 数据 科学 课程 群 建设 现状 ,聚焦 数据 科学 人 才 培 养 方案 ,为 我 国 高 校 信息 学 院 数据 科学 教学 实 
践 提供 参考 和 借鉴 。[ 方 法 /过 程 ] 基于 UIUC( 美 国 伊 利 诺 伊 大 学 香槟 分 校 ) 信 息 科学 学 院 的 数据 科学 课程 实践 ， 
首先 调研 该 院 数据 科学 相关 课程 的 名 称 、 简 介 、 学 制 学 时 、 授 课 形 式 、 授 课 教师 及 授课 对 象 ,然后 从 培养 对 象 类 型 、 
授课 形式 授课 合 作 程 度 和 课程 内 容 4 个 方面 对 课程 群 进 行 系统 分 类 和 比较 分 析 , 最 后 对 我 国 高 校 数 据 科 学 课程 
建设 提出 若干 建议 。[ 结果 /结论 ] UIUC 数据 科学 课程 群 可 分 为 六 大 类 别 ,面向 本 硕 博 各 阶段 学 生 , 采 用 线 上 线 


下 相 结合 的 混合 式 教 学 方式 ,通过 教师 合作 开展 授课 ,教学 内 容 紧 密 跟 随 数据 科学 岗位 市 场 需求 。 因 此 ,我 国 高 
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连续 性 、 丰 富 教 学 创新 性 、 加 强 教师 授课 合作 性 、 增 强 研究 方向 完备 性 。 
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CD 第 四 次 工业 革命 促进 了 社会 发 展 方式 的 转变 ,大 
数据 基础 研究 、 产 品 研发 和 业务 应 用 等 各 类 人 才 较 为 
糊 例 " 。Talkingdata 发 布 的 专业 数据 人 才 教 育 行业 生 
态 报告 显示 ,到 2025 年 我 国 将 面临 200 万 数据 科学 人 
必 噢 口中。 现 阶段 国内 外 数据 科学 岗位 技能 要 求 旦 现 
“ 糖 于 一 而 又 博学 "的 特点 ,高 端 人 才 市 场 需求 量 大 且 
竞 艇 激烈 。 工 信 部 《大 数据 产业 发 展 规划 (2016 - 
2020) 》 明确 指出 大 数据 产业 人 才 队 伍 建 设 坡 需 加 强 。 
为 顺应 时 代 发 展 潮流 和 满足 国家 建设 需求 ,2016 年 孝 
育 部 首次 增设 “数据 科学 与 大 数据 技术 ”本 科 专 业 , 仅 
2019 年 新 增设 的 数据 科学 与 大 数据 技术 专业 点 高 达 
196 个 ,大 数据 管理 与 应 用 专业 点 达 25 个 中 。 因 此 , 控 
究 数 据 科学 课程 建设 现状 ,优化 数据 科学 人 才 培养 方 
案 , 建 立 满足 社会 市 场 需求 的 数据 科学 教育 体系 势 在 
必 行 。 美 国 伊利 诺 伊 大 学 香槟 分 校 (University of TUi- 
nois at Urbana - Champaign ,简称 “UIUC”) 信息 科学 学 
院 (School of Information Sciences , 简称 “igSchool”) 一 直 
是 图 情 档 领域 和 信息 科学 领域 的 领航 者 , 自 1996 年 以 


I 


来 ,该 院 图 书 情报 专业 排名 稳 居 全 美 第 一 。 因 此 ,在 
“ 双 一 流 ” 学 科 建 设 背 景 下 ,笔者 希望 通过 对 UIUC 
iSchool 数据 科学 课程 开展 情况 的 调研 ,为 我 国 高 校 数 
据 科学 专业 的 课程 建设 和 人 才 培 养 提供 参考 。 


2 相关 研究 


通过 文献 调研 发 现 ,国外 学 者 主要 集中 于 数据 科 
学 学 科 理 论 研 究 数据 科学 教育 教学 实践 研究 和 数据 
科学 的 应 用 研究 。 在 数据 科学 学 科 理 论 研究 方面 , 知 
名 月 麦 籍 计 算 机 科学 家 、 图 灵 奖 获得 者 PNaur 于 
1974 年 率先 正式 提出 术语 数据 科学 ( Data Science ) 。 
他 在 其 专著 《计算 机 方法 的 简明 调查 》( Concise Survey 
of Computer Methods ) 的 前 言 中 阐述 了 数据 科学 的 内 
涵 , 并 在 书 中 辨析 了 数据 科学 与 数据 学 ( Datalogy ) 的 差 
异 "。 随 后 ,D.Conway 在 2010 年 提出 了 数据 科学 韦 
恩 图 (The Data Science Venn Diagram) ,首次 确立 了 数 
据 科 学 的 学 科 地 位 一 一 处 于 机 器 学 习 、 数 学 与 统计 学 
和 某 一 专业 领域 实务 知识 的 交叉 地 带 5 。 在 数据 科学 
教育 教学 实践 研究 方面 ,国外 学 者 较 多 侧重 研究 某 一 
典型 院 校 面 向 本 科 生 数据 科学 课程 的 具体 情况 。 如 
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P.，Anderson'" 等 描述 了 美国 南 卡罗来纳 州 查尔斯 顿 学 
院 (College of Charleston, South Carolina，USA ) 的 数据 
科学 课程 计划 及 实施 经 验 。B. Baumer 和 S.College'” 
介绍 了 美国 著名 七 姊妹 学 院 之 一 史密斯 学 院 的 数据 科 
学 教学 模块 组 成 ,如 数据 可 视 化 、 数 据 操作 ( Data Ma- 
nipulation ) /数据 整理 (Data wrangling) .计算 统计 、 机 器 
学 习 (或 统计 学 习 ) 以 及 拓展 议题 ,如 空间 分 析 、 文 本 
挖掘 .数据 探索 .网络 科学 等 ,也 为 学 生 数据 处 理 能 

的 培养 提供 可 行 性 建议 。R，Veaux 和 M.，Agarwal "等 
详细 介绍 了 帕克 城市 数学 学 院 (PCMI)2016 年 暑期 数 
据 科学 本 科 课 程 的 制定 指南 ,该 指南 旨 在 为 学 院 规划 
数据 科学 专业 提供 一 些 结构 性 参考 。V. Song 和 了 
Zhu 提供 了 一 个 分 层 的 数据 科学 教育 框架 ( Data Sci- 
enpe- Education Framework ) ,由 数据 科学 三 大 支柱 (人 
员 - 歌 术 和 数据 .计算 思维 数据 驱动 范式 和 数据 科学 
恬 合 周期 四 个 模块 组 成 。 基 于 该 框架 ,他 们 在 德 雷 塞 
多 大 学 开展 了 基于 用 户 、 基 于 工具 和 基于 应 用 程序 的 
数 矣 科学 课程 。 此 外 ,国外 学 者 还 从 iSchools 与 数据 科 
党 闲 育 的 关系 出 发 阔 述 领域 总 体 概况 ,如 V，Song 和 
二 hu 认为 iSchools 是 数据 科学 教育 的 中 心 枢纽 ， 
二 领域 的 跨 学 科 师资 团队 能 够 培育 出 大 量具 备 多 种 
技 舱 和 广阔 视野 的 数据 科学 家 。 在 数据 科学 应 用 研究 
状 六 ,国外 研究 较 多 涉及 政府 治理 .业务 管理 .医疗 保 
卫 : 命 科学 .金融 经 济 .数据 新 闻 等 领域 。 

>< 近 几 年 ,国内 学 者 开始 陆续 对 数据 科学 项 目 展开 
调 锭 和 研究 ,内 容 集 中 在 国内 外 数据 科学 教学 实践 的 
对 化 分 析 。 在 数据 科学 课程 建设 方面 , 朝 乐 门 , 杨 灿 
罕 ( 等 调查 了 全 球 数据 科学 课程 建设 现状 ,总 结 了 国 
内 外 数据 科学 课程 的 共性 特色 、 共 识 经 验 及 问题 挑战 ， 
在 探讨 解决 对 策 时 重点 提出 了 10 个 关于 数据 科学 课 


学 工具 .数据 挖掘 ,数据库 和 数据 管理 .数据 的 社会 影 
响 .数据 政策 与 法 规 和 自主 学 习 。 苏 日 娜 等 扩 对 开设 
数据 科学 研究 生 项 目的 15 所 iSchools 高 校 从 专业 学 科 
优势 学科 体系 划分 .课程 目标 、 核 心 课程 设置 课程 制 
度 等 方面 进行 研究 ,探讨 了 图 书馆 与 信息 科学 (LIS) 视 
域 下 数据 科学 学 科 建 设 及 人 才 培 养 等 问题 。 邓 胜利 、 
付 少 雄 "从 教育 体系 、 学 术 研 究 与 社会 实践 三 个 维度 
对 德 雷 塞 尔 大 学 计算 与 信息 学 院 图 书 情报 学 科 建 设 情 
况 进行 调研 ,探究 数据 驱动 以 及 计算 科学 与 信息 科学 
融合 下 的 图 情 学 科 的 新 发 展 。 

综 上 ,国内 iSchools 数据 科学 教育 相关 研究 仍 处 
于 起 步 阶 段 ,研究 方法 较 多 采用 网 站 调研 ,研究 内 容 以 
对 数据 科学 教学 实践 的 宏观 对 比分 析 为 主 , 体 现在 数 
据 科学 教育 项 目 和 课程 建设 方面 ;缺乏 对 国外 一 流 代 
表 性 院 校 数据 科学 课程 信息 微观 细节 的 深入 挖掘 和 分 
析 ,缺乏 对 数据 科学 课程 的 实地 考察 研究 ,缺乏 对 数据 
科学 课程 教学 细节 的 分 维度 调研 。UIUC iSchool 作为 
际 图 情 学 科 的 引领 者 ,是 郑州 大 学 信息 管理 学 院 本 
科教 育 教学 建设 “一 院 一 对 标 ” 项 目的 对 标 单位 。 因 
此 本 文 将 结合 我 院 自身 实际 和 国内 教育 实践 ,通过 实 
地 考察 辅 以 网 站 调研 ,充分 探究 对 标 学 院 数 据 科 学 课 
程 群 开设 情况 ,获取 文 撑 数据 科学 课程 建设 和 发 展 的 
一 手 资 料 , 从 培养 对 象 类 型 .授课 形式 .授课 合作 程度 
和 课程 内 容 四 个 维度 展开 课程 建设 的 微观 剖析 ,以 期 
对 我 院 , 力 至 国内 数据 科学 课程 的 建设 提供 参考 和 借 
鉴 。 


3 ”数据 来 源 与 研究 方法 


本 研究 的 数据 来 源 于 实地 考察 和 网 站 调研 。2018 
年 7 月 至 2019 年 7 月 本 文 作者 之 一 杨 瑞 仙 在 UIUC 访 


加 


程 设 计 与 教学 改革 的 核心 问题 ;之 后 , 朝 乐 门 . 邢 春晓 
等 (中 从 特色 课程 角度 深入 调研 了 8 所 世界 一 流 名 校 
数据 科学 专业 的 培养 方案 并 对 其 特色 课程 进行 分 类 ， 
为 我 国 大 数据 教育 建设 中 存在 的 不 足 与 曲解 提供 建 
议 ; 李 莎 莎 . 周 竞 文 等 分别 从 本 科教 育 和 硕士 研究 
生 教育 层次 对 比分 析 了 国内 外 14 所 高 校 的 数据 科学 
及 大 数据 相关 专业 ,结合 各 院 校 的 课程 设置 和 培养 方 
案 , 为 建设 大 数据 人 才 培 养 模 式 提供 建议 。 

在 iSchools 数据 科学 教育 项 目 研究 方面 , 间 正 、 张 
钰 浩 等 "调研 了 iSchools 联盟 中 10 所 院 校 数据 科学 
教育 相关 专业 的 141 门 课程 信息 ,并 将 这 些 课程 按照 
课程 内 容 分 为 12 类 ;基础 理论 课 、 相 关 学 科 理 论 基 础 
课 、 统 计 学 .机 器 学 习 、 数 据 可 视 化 .数据 分 析 、 数 据 科 


学 期 间 共 研 修了 四 门 数 据 科学 课程 
cal Models ，and Information ( 数据、 统计 模型 和 信息 )、 
Information Organization & Access (信息 组 织 与 获取 )、 
Foundations of Data Science( 数据 科学 导论 ) ,Theory and 
Practice Data Cleaning( 数 据 清 洗 理论 与 实践 ) ,她 通过 
线 上 线 下 相 结合 的 形式 参与 所 有 课程 的 学 习 和 讨论 。 
2019 年 10 月 本 文 两 位 作者 共同 在 UIUC iSchool 学 院 
网 站 上 (https :A//ischool. illinois. edu/ ) , 以 “data ”为 关 
键 词 在 网 页 搜索 框 中 进行 检索 ,选择 * Type = Course 
后 得 到 42 条 课程 数据 结果 ,并 以 此 作为 研究 对 象 进行 
资料 的 梳理 和 分 析 。 

在 调研 过 程 中 ,笔者 紧密 结合 课堂 实践 收获 .课程 
共享 资料 和 网 站 课程 信息 ,利用 统计 分 析 、 对 比分 析 和 


Data, Statisti- 
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归纳 总 结 等 多 种 研究 方法 ,对 UIUC iSchool 的 42 门 数 
据 科 学 相关 课程 细节 进行 系统 梳理 和 深入 分 析 , 重 点 
考察 研究 对 象 的 课程 名 称 及 简介 .学 制 学 时 、 授 课 形 
式 授课 对 象 及 师资 情况 。 


4 UIUC 数据 科学 课程 群 总 体 概况 


不 同学 者 对 数据 科学 有 不 同 的 定义 ,JStantonim 
认为 数据 科学 是 与 收集 ,准备 .分析 .可视化 .管理 和 保 
存 大 批量 数据 相关 工作 的 新 兴 领 域 ;V. Dhar" 认 为数 
据 科 学 是 从 数据 中 获取 知识 的 研究 ;F，Provost 和 TT. 
Fawcett'” 认为 数据 科学 是 通过 自动 分 析 数 据 来 理解 
现存 现象 的 原理 .过 程 和 技术 。 密 欣 根 大 学 数据 科学 
项 目 ( Data Science Initiative, DS1)' 认为 数据 科学 是 
将 各 学 发 现 与 实践 相 联 结 的 一 系列 过 程 , 它 涉 及 大 规 
檬 易 构 数据 的 收集 管理, 处 理 ,分 析 、 可 视 化 和 解读， 
这 由 数据 往往 与 可 转化 的 、 跨 学 科 的 科学 应 用 相关 。 

二 通过 归纳 分 析 各 种 定义 ,不 难 发 现 数据 科学 的 研 
究 和 应 用 对 象 是 大 批量 数据 ,其 基本 流程 包含 数据 的 
收 靠 ,整理 ,加工 .展现 等 。2015 年 ,斯 坦 福 大 学 统计 
受 D.L，Donoho™™ 在 其 数据 科学 50 年 的 报告 中 
出 ,完整 的 数据 科学 可 以 划分 为 六 大 部 分 ,分 别 

所 探索 和 准备 ,数据 表示 和 转换 ` 数 据 计算 、 数 据 
建 入 .数据 可 视 化 和 演示 .数据 科学 相关 科学 ,各 部 分 
表 寺 如 图 1 所 示 ， 


可 视 化 
图 1 数据 科学 的 组 成 


笔者 据 此 对 UIUC iSchool 数据 科学 课程 进行 了 分 
类 汇总 和 分 析 。 表 1 显示 了 具体 情况 。 其 中 ,数据 探 
索 和 准备 类 约 占 16.67% , 其 核心 课程 有 数据 科学 基 
础 .数据 管 护 基础 ,信息 处 理 基础 ,重视 数据 库 管理 与 
体系 结构 方面 的 理论 与 实践 ,强化 系统 思想 。 数 据 表 
示 和 转换 类 约 占 16.67% ,核心 课程 有 数据 清洗 理论 
与 实践 元 数据 理论 与 实践 ,重视 学 生 利用 计算 机 处 理 
数据 的 编程 能 力 。 数 据 可 视 化 和 演示 类 约 占 9.52% ， 
其 核心 课程 包含 数据 可 视 化 数据 科学 故事 化 ,关注 沟 
通 交 流 数 据 潜藏 的 信息 、 知 识 。 数 据 计算 类 约 占 
4.76% ,以 云 计算 导论 .机 器 学 习 社 会 计算 前 沿 为 重点 
内 容 。 数 据 建 模 类 约 占 7.14% ,核心 课程 是 Data ，Sta- 
tistical Models ，and Information ( 数据、 统计 模型 与 信 
息 )。“ 数 据 科学 + ”学 科 类 比例 最 高 约 占 45. 24% ,多 
为 选修 课 , 如 竞争 情报 与 知识 管理 .科研 数据 政策 人 研 
讨 、 实 用 健康 数据 分 析 、 数 据 伦 理 \ 生 物 信息 学 问题 与 
研究 .社交 媒体 分 析 、 金 融 预 测 分 析 等 ,说 明 该 学 院 课 
程 涉及 领域 广泛 .教学 内 容 新 颖 ,学 生 研修 的 可 选择 性 
强 , 有 利于 深化 培养 各 类 专项 人 才 ,使 学 生 通 过 个 性 化 
定制 课程 获得 应 对 就 业 环境 压力 的 能 


[en 表 1 UIUC iSchool 数据 科学 课程 名 称 及 分 类 


本 一 课程 类 别 


课程 名 称 


数 辕 探索 和 准备 类 (7 门 , 占 
16.67% ) 


数据 表示 和 转换 类 (7 门 , 占 
16.67% ) 


数据 计算 类 (2 门 , 占 4.76% ) 


前 沿 ) 
数据 可 视 化 和 演示 类 (4 门 ， 
占 9.52% ) Network Analysis( 网 络 分 析 ) 


数据 建 模 类 (3 门 , 占 7.14% ) 
formation( 数据 、 统 计 模 型 和 信息 ) 


数据 科学 + 学 科 类 (19 门 , 占 
45.24% ) 


Data Analytics( 颁 


Data Mining( 数据 挖 气 ) ; Foundations of Data Science( 数据 科学 基础 ) ; Advanced Data Science( 高 级 数据 科学 ) ; Foundations 
of Data Curation( 数据 管 护 基础 ) ; Big Data Infrastructures for Research and Development( 用 于 研发 的 大 数据 基础 设施 ) ; Foun- 
dations of Information Processing( 信息 处 理 基础 ) ; Database Administration and Scaling for IS (数据 库 管 理 及 系统 设计 ) 


Open Data Mashups( 开放 数据 融合 ) ; Theory and Practice Data Cleaning( 数据 清洗 理论 与 实践 ) ; Programming for Analytics and 
Data Processing( 数据 分 析 处 理 编 程 ) ; Introduction to Databases( 数据库 导论 ) ; Database Design and Prototyping( 数 据 库 设计 与 
原型 构建 ) ; Qualitative Methods Research( 定性 方法 研究 ) ; Metadata in Theory and Practice( 元 数据 理论 与 实践 ) 
Introduction to Cloud Computing( 云 计 算 导 论 ) ; Advanced Topics in Machine Learning & Social Computing( 机 器 学 习 和 社会 计算 


Data Visualization ( 数据 可 视 化 ) ; Advanced Data Visualization ( 高 级 数据 可 视 化 ) ;Data Science Storytelling( 数据 科学 故事 化 ) ; 


Methods for Data Science( 数据 科学 方法 概论 ) ; Introduction to Data Science( 数据 科学 导论 ) ; Data，Statistical Models ，and In- 


Community Data( 社区 数据 ) ; Data Ethics( 数据 伦理 ) ; Scientific Data Policy Seminar( 科研 数据 政策 研讨 ) ; Practical Health 
健康 数据 分 析 ) ; Data Warehousing and Business Intelligence( 数据 仓库 与 商务 智能 ) ; Data Science in the 
Humanities( 人 文中 的 数据 科学 ) ; Business Analytics( 商务 分 析 ) ; Internet of Things and Applications for Business( 物 联网 及 其 


商业 应 用 ) ; Social Media Analytics( 社交 媒体 分 析 ) ; Privacy in the Internet Age( 互 联网 时 代 的 隐私 ) ; Information Ethics ( 信 


息 伦 理 ) ; Local, Regional, and Global Intersections in LIS ( 图 


情 领域 内 本 地 、 区 域 、 全 球 交叉 分 析 ) ;Competitive Intelligence 


and Knowledge Management( 竞争 情报 与 知识 管理 ) ; Information Consulting( 信息 咨询 ) ; Bioinformatics Problems and Research 
(生物 信息 学 问题 与 研究 ) ; Predictive Analysis in Finance( 金融 中 的 预测 分 析 ) ; Copyright for Information Professionals( 信息 科 


(图 书馆 及 其 信息 研究 人 员 的 专业 交流 ) 


人 研 人 员 版 权 研究 ) ; Digital Humanities (数字 人 文 ); Professional Communication for Library and Other Information Professionals 
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UIUC iSchool 教学 形式 个 性 多 样 , 每 年 有 三 个 学 
期 ,分 别 为 春季 学 期 (Spring) 秋季 学 期 (Fal) 和 夏季 
小 学 期 (Summer) 。 其 中 ,春秋 两 个 学 期 的 课程 设置 几 
乎 没有 区 别 , 仅 个 别 课程 授课 教师 有 些 调整 ,授课 形式 
有 变 。 所 调研 的 数据 科学 课程 群 中 在 夏季 小 学 期 的 授 
课 课程 分 别 是 商务 分 析 ( Business Analytics) ,信息 人 处理 
基础 (Foundations of Information Processing) 数据库 基 
础 (Introduction to Databases ) 元 数据 理论 与 实践 
(Metadata in Theory and Practice ) 和 信息 研究 人 员 的 版 
权 人 研究 ( Copyright for Information Professionals ) 。 这 五 
门 夏季 小 学 期 课程 中 ,商务 分 析 ( Business Analytics ) 、 
信息 处 理 基 础 (Foundations of Information Processing ) 和 
元 数据 理论 与 实践 (Metadata in Theory and Practice ) 同 
时 曲 在 春季 学 期 和 秋季 学 期 开设 ;但 剩余 的 两 门 数据 
所 医 而 (Introduction to Databases ) 和 信息 研究 人 员 的 版 
权 和 研究 ( Copyright for Information Professionals ) 仅 在 春 
厄 到 期 开设 ,秋季 取消 。 这 说 明 部 分 课程 授课 质量 高 
和 学 生 满 意 度 高 收获 大 ,受到 追捧 。 夏 季 小 学 期 每 门 
课 各 的 总 课时 量 约 为 24 -48 学 时 , 相 较 于 春秋 季 学 其 
每 问 课 程 的 总 课时 量 32 - 64 学 时 较 短 。 在 较 短 时 间 
师 高 效 完成 重点 课程 和 热门 课程 的 教学 活动 ,有 利于 
满 思 学 生 的 学 习 需 求 ,显著 增加 这 些 课程 的 影响 。 此 
儿 滞 校 的 国际 短期 交流 项 目 _ 全 球 教育 与 培训 
(GBbal Education and Training,GET) 也 是 夏季 小 学 期 
的 必 色 ,例如 ,2018 年 7 月 来 自 中 国 一 流 高 校 的 本 科 生 
通过 CET 的 资助 来 到 UIUC 信息 学 院 学 习 了 由 了 
Ji 可 = 副教授 讲授 的 网 络 分 析 课 程 (数据 科学 课程 群 
中 数据 可 视 化 和 演示 类 课程 之 一 )。 


5 ”UIUC 数据 科学 课程 群 设置 分 析 


在 总 体 梳理 UIUC iSchool 数据 科学 课程 的 分 类 、 
数量 分 布 ,特色 学 期 等 内 容 基础 上 ,还 需要 进一步 从 不 
同 视 角 探 究 UIUC 数据 科学 教育 与 教学 活动 的 经 验方 
法 。 具 体 来 说 ,笔者 主要 从 培养 对 象 层次 、 授 课 形 式 、 
教师 合作 授课 情况 .授课 内 容 4 个 维度 展开 分 析 。 

5.1 培养 对 象 层 次 分 析 

通过 统计 ,笔者 发 现 UIUC iSchool 数据 科学 课程 
群 中 91% 的 授课 对 象 是 硕士 生 ,7% 是 本 科 生 ,2% 是 
博士 生 , 现 阶段 硕士 培养 体系 较为 成 熟 ( 见 图 2)。 

本 科 生 阶段 由 于 学 生 数 学 统计 学 知识 不 够 夯实 ， 
专业 基础 积淀 不 够 深厚 ,很 多 数据 科学 课程 无 法 按照 
数据 科学 流程 及 进度 设置 教学 计划 和 课程 计划 ;因此 ， 
UIUC iSchool 数据 科学 课程 群 中 本 科 阶 段 仅 涉及 3 门 


本 科 生 课程 。 硕士 课程 博士 课程 


2 数据 科学 课程 群 培养 对 象 类 型 


课程 ,分 别 是 数据 科学 基础 (Introduction to Data Sci- 
ence) 信息 处 理 基础 (Foundations of Information Pro- 
cessing) 和 数据 库 设 计 与 原型 构建 (Database Design 
and Prototyping) 。 这 些 课 程 并 没有 要 求学 生 提 前 拥有 
编程 基础 ,而 是 通过 课程 为 学 生 提 供 良 好 的 数据 库 基 
础 理论 以 及 用 编程 语言 解决 抽象 问题 的 方法 ,为 学 生 
在 数据 分 析 数据 科学 文本 挖掘 ,数字 图 书馆 和 知识 
管理 中 的 应 用 做 好 准备 。UIUC 信息 学 院 博 士 阶 段 同 
样 没 有 特别 详细 的 数据 科学 学 位 的 培养 目标 和 规划 。 
现存 的 唯一 一 门面 向 博士 生 的 数据 科学 课程 ,机 器 学 
习 和 社会 计算 前 沿 ( Advanced Topics in Machine Learn- 
ing & Social Computing) ,是 针对 校内 所 有 博士 生 进行 
教育 的 课程 。 课 程 内 容 主 要 涉及 深度 学 习 、 生 成 对 抗 
网 络 ,对抗 性 学 习 、 词 能 入 以 及 经 过 筛选 的 人 工 智 能 中 
的 热门 主题 (尤其 是 数据 学 习 中 的 偏见 数据 公平 和 数 
据 伦理 等 ) 。 博 士 阶 段 的 数据 科学 课程 采用 研讨 会 的 
形式 开展 教学 活动 ,学 生 们 深入 探讨 以 上 主题 的 论文 ， 
在 更 广泛 的 理论 .方法 和 领域 中 分 析 论 文 ,并 在 自己 的 
研究 背景 下 对 讨论 的 论文 进行 反思 。 
5.2 授课 形式 分 析 

UIUC 的 授课 形式 有 三 种 ,分 别 是 在 校 面 授课 程 
(On-Campus) 在 线 课程 (Online) 和 混合 式 授课 课程 
(On-Campus && Online ) 。UIUC 采用 Moodle 课程 教学 
管理 系统 ,帮助 实现 自主 选课 教学 信息 发 布 . 课 程 资 
料 和 课堂 作业 上 传 下 载 . 群 组 互动 研讨 学术 报告 宣讲 
等 功能 。2019 年 以 前 , Moodle 系统 通过 借助 Black- 
board Collaborate Ultra 网 络 会 议 系统 可 进行 每 周 实时 
同步 会 话 ,提供 双 路 音频 视频 白板、 分 组 讨论 室 及 屏 
幕 共享 等 服务 ; 自 2020 年 春季 学 期 起 ,网 络 会 议 系 统 
将 逐步 转换 为 ZO00M 系统 。 

在 UIUC 信息 学 院 数据 科学 课程 群 中 ,在 校 面授 
课程 ( On-Campus ) 占 55. 1% ;混合 式 授课 课程 ( On- 
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Campus 人 Online ) 占 34. 5% ;在 线 课程 (Online) 占 
10.3% , 见 表 2。 由 此 可 见 ,当前 数据 科学 课程 大 多 仍 
以 传统 的 在 校 面授 授课 形式 为 主 , 如 数据 库 管 理 及 系 
统 设 计 (Database Administration and Scaling for IS) 和 元 
数据 理论 与 实践 (Metadata in Theory and Practice ) 等 。 
在 科研 第 四 范式 一 一 数据 密集 型 科学 范式 的 环境 下 ， 
单纯 地 依靠 传统 在 校 面授 的 授课 形式 往往 不 能 满足 教 
学 科研 活动 需求 。 在 大 数据 时 代 , 当 数据 科学 课程 群 
的 培养 对 象 为 研究 生 和 群体 时 ,新 型 的 混合 式 授课 模式 
在 提升 课 答 质量 .增强 自身 数据 素养 方面 更 能 满足 师 
表 2 ”UIUC iSchool 数据 科学 不 同类 型 课程 占 比 


在 校 & 在 线 课 单 类 合计 / 
程 数 (On-Campus 占 课程 总 比 


(On-Campus) (Online) 


& Online) (%) 

杜 索 探索 和 准备 1 0 2 3710.3 
数据 表示 和 转换 1 0 5 6/20.7 
CN 数据 计算 1 1 0 2/6.9 
于 数据 建 模 2 0 1 3/10.34 
数据 订 视 化 和 演示 4 0 0 4/13.8 
数据 科学 + 学 科 7 2 2 11/37.9 
SB tr(% ) 16/55.1 3/10.3 10/34.5 29/99.9 
C6 注 :42 门 课程 中 , 仅 有 29 门 课程 授课 形式 介绍 完整 
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数据 探索 和 准备 ”数据 表示 和 转换 ”数据 计算 


图 独立 授课 


生 的 需求 ,如 数据 挖掘 (Data Mining) 。 混 合式 授课 课 
程 中 部 分 课程 采用 实时 同步 的 创新 方式 ,方便 学 生 自 
主 选择 学 习 时 间 、 学 习 空间 和 学 习 方 式 , 如 数据 清洗 理 
论 与 实践 (Theory and Practice Data Cleaning) 。 纯 在 线 
课程 占 比 较 小 ,大 多 集中 在 “数据 科学 + "学 科 类 课程 
中 ,如 竞争 情报 与 知识 组 织 (Competitive Intelligence 
and Knowledge Management ) 。 
5.3 教师 合作 授课 情况 分 析 

独立 授课 指 一 门 课程 仅 由 一 位 教师 进行 教学 活动 
(备课 .授课 .考核 等 ) ;合作 授课 指 一 门 课程 由 两 位 或 
两 位 以 上 的 教师 和 助教 进行 教学 活动 。 按 照 独立 授课 
和 合作 授课 的 定义 为 划分 标准 ,笔者 对 UIUC iSchool 
的 数据 科学 课程 进行 统计 ,得 到 如 图 3 所 示 的 数据 科 
学 课程 群 教师 合作 授课 分 析 图 。 从 整体 来 看 ,独立 授 
课 课 程 较 多 , 共 16 门 ,合作 授课 课程 较 少 , 共 13 门 ,多 
数 独立 授课 课程 主要 集中 于 “数据 科学 + 学科” 这 一 
类 ,独占 8 门 。 除 数据 探索 和 准备 类 课程 全 部 是 合作 
授课 ,数据 计算 类 课程 全 部 是 独立 授课 ,其 他 类 课程 独 
立 授课 与 合作 授课 相对 均衡 。 


数据 建 模 
国 合作 授课 


数据 可 视 化 和 演示 。 数据 科学 + 学科 


图 3 数据 科学 课程 群 授课 合作 分 析 


从 图 3 可 以 发 现 六 大 类 课程 的 授课 合作 情况 各 有 
地点 。 在 不 考虑 部 分 课程 内 容 信息 缺失 的 情况 下 , 数 
据 探索 和 准备 类 课程 中 合作 授课 的 课程 有 三 门 , 这 三 
门 课 程 都 采用 在 校 面 授 的 教学 方式 , 且 授 课 教 师 均 为 
两 人 ;其 中 数据 挖掘 课程 ( Data Mining) 和 信息 处 理 基 


(Theory and Practice Data Cleaning ) 与 一 门 合作 授课 的 
课程 , 即 数据 分 析 处 理 编 程 课程 ( Programming for Ana- 
lytics and Data Processing ) 采用 实时 同步 的 新 型 教学 方 
式 , 即 教师 在 教室 中 的 教学 活动 会 实时 更 新 到 教学 系 
统 的 指定 栏目 中 ,方便 学 生 自主 选择 学 习 时 间 ,学 习 空 


础 课程 (Foundations of Information Processing ) 采 用 在 校 
面授 & 在 线 指 导 的 混合 式 教学 方式 。 数 据 表 示 和 和 转 
换 类 课程 中 独立 授课 的 课程 和 合作 授课 的 课程 均 为 三 
门 ,其 中 两 门 独立 授课 的 课程 , 即 开 放 数 据 融 合 课程 
(Open Data Mashups ) 和 数据 清洗 理论 与 实践 课程 


间 和 学 习 形 式 ,为 不 同类 型 的 学 生 接受 课堂 知识 提供 
了 更 多 的 可 能 性 。 数 据 计算 类 课程 全 部 为 独立 授课 ， 
且 两 门 课程 均 采用 在 校 面授 的 教学 形式 。 云 计算 导论 
(Introduction to Cloud Computing) 课程 重点 介绍 云 计 算 
的 各 种 服务 应 用 场景 ,也 讲解 了 公有 云 、 私 有 云 .混合 
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云 .APl 和 数据 安全 等 关键 概念 ;机 器 学 习 和 社会 计算 
前 沿 (Advanced Topics in Machine Learning & Social 
Computing ) 课程 主要 通过 学 生 积 极 参与 深度 学 习 、 对 
抗 性 网 络 生 成 .对 抗 性 学 习 以 及 人 工 知 能 某 些 话题 的 
专题 论文 研讨 会 ,深入 分 析 这 些 专题 论文 的 研究 背景 、 
研究 理论 .研究 方法 和 研究 成 果 。 这 两 门 课程 均 对 教 
师 迅 速 捕 提 学 生理 解 程度 的 能 力 有 较 高 要 求 , 故 UIUC 
信息 学 院 对 数据 计算 类 课程 全 部 采用 在 校 面授 的 教学 
形式 ,这 种 方式 符合 学 生 吸 收 知识 消化 问题 .反思 感 
悟 的 现实 规律 ,体现 了 该 学 院 细致 人 微 的 学 生 教学 设 
计 和 以 “服务 学 生 为 本 ”的 教学 教育 理念 。 

数据 建 模 类 课程 中 独立 授课 的 课程 有 一 门 ,合作 
授课 的 课程 有 两 门 ,其 中 数据 、 统 计 模 型 和 信息 课程 
(Data，Statistical Models ，and Information ) 由 两 名 授课 
教师 Vetle Torvik 和 Jil Naiman ) 和 三 名 助教 (Chenyue 


者 在 UIUC 访 学 期 间 结 合 研究 方向 选择 研修 本 门 课 
程 。 该 课程 探讨 的 话题 列举 见 表 3 ,包括 数据 模型 信 
息 概 述 ,R 语言 数据 分 析 简 介 , 可 能 性 、 条 件 关 联 性 与 
贝 叶 斯 定理 ,随机 变量 、 期 望 和 方差 ,数据 推断 基础 , 数 
值 与 分 类 数据 ,线性 模型 介绍 ,线性 回归 :多 元 线性 回 
归 ,分 类 与 逻辑 回归 。 该 课程 首先 回顾 了 概率 论 的 相 
关内 容 , 认 真 分 析 了 常见 的 概率 分 布 作为 信息 建 模 工 
具 的 优 缺 点 ;随后 ,介绍 了 包括 参数 和 非 参 数 预测 模 
型 ,以 及 这 些 模型 在 无 监督 学 习 中 的 扩展 。 在 所 有 的 
讨论 中 ,本 课程 侧重 于 选择 模型 和 度量 模型 的 质量 ,及 
介绍 统计 概率 模型 在 信息 管理 任务 中 的 应 用 (例如 , 预 
测 、 排 名 和 数据 缩减 等 )。 通 过 对 课堂 话 题 内 容 和 课程 
简介 内 容 的 分 析 , 可 以 看 出 数据 、 统 计 模 型 和 信息 课程 
(Data，Statistical Models ，and Information ) 涉及 统计 学 、 
机 需 学 习 、R 语言 等 理论 与 实践 应 用 等 多 方面 内 容 , 教 


Jimy Xiaoliang Jiang 和 Pingjing Yang) 组 织 完 成 教学 ， 
该 这 程 是 UIUC 信息 学 院 信息 管理 学 硕士 仅 开设 的 三 
门 动 修 课程 之 一 ,是 进入 本 领域 学 习 研 究 的 基础 。 笔 


学 任务 繁重 多 样 ,教学 信息 体 量 巨大 。 若 采用 传统 独 
工 授 课 的 教学 形式 ,课程 的 教学 质量 难以 得 到 保证 ,学 
生 的 积极 性 也 无 法 得 到 激发 。 


表 3 数据 .统计 模型 和 信息 课程 课堂 话题 


Foundations for inference from data 


Numerical vs. Categorical data 


8 Linear regression: multiple linear regression 


9 Classification and logistic regression 


UIUC 信息 学 院 信息 管理 学 硕士 学 位 必修 课 一 一 
数据 .统计 模型 和 信息 课程 (Data,，Statistical Models， 
and Information ) 主要 由 副教授 V.， Torvik 和 客座 教授 
J. Naiman 联合 采用 合作 授课 的 方式 组 织 完 成 授课 教学 
工作 ,两 位 授课 教师 的 研究 方向 见 表 4, 其 中 Vetle Tor- 
vik 主要 从 事 于 数学 优化 .计算 统计 文本 和 数据 挖掘 、 


Probability; joint and conditional; Bayes Thm 


Random variables ，expectation and variance 


Introduction to linear models; linear regression 


课堂 话题 课堂 话题 翻译 
Introductions and Overview of Data, Models, and Information 数据 模型 信息 概述 
Introduction to data analysis with R R 语言 数据 分 析 简 介 


可 能 性 、 条 件 关联 性 ; 贝 叶 斯 定理 
随机 变量 ,期望 和 方差 


数据 推断 基础 


数值 与 分 类 数据 
线性 模型 介绍 ;线性 回归 


线性 回归 :多 元 线性 回归 


分 类 与 逻辑 回归 


基于 文献 的 发 现 和 生物 信息 学 领域 的 研究 ;客座 教授 
Jil Naiman 主要 关注 科学 中 有 效 且 引人入胜 的 数据 可 
视 化 的 方法 。 两 位 授课 教师 分 别 在 理论 与 实践 两 个 方 
向 上 各 有 专长 ,合作 授课 可 以 更 好 地 发 挥 各 位 授课 教 
师 的 专长 ,更 能 提高 该 门 信息 管理 学 硕士 学 位 必修 课 
的 课程 品质 。 


表 4 数据 .统计 模型 和 信息 课程 授课 教师 研究 方向 及 现 阶 段 教 授课 程 


姓名 职称 研究 领域 


现 阶段 教授 课程 


Associate Professor 


副教授 


Vetle Torvik 


ics. 


Jl Naiman Adjunct Lecturer 


客座 教授 


sciences 


Mathematical optimization; computational statistics; text 


and data mining; literature-based discovery; bioinformat- 


methods for efficient and engaging data visualization in the 


Data Mining; Data, Statistical Models, and Information; 
Information Organization and Access; Methods for Data 
Science 

Data Visualization; Data, Statistical Models, and Informa- 


tion; Foundations of Information Processing 
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UIUC 信息 学 院 信息 管理 学 硕士 学 位 通过 高 度 融 
合 “ 人 信息 和 技术 ”的 灵活 课程 ,引领 学 生 学 会 利用 
当下 激增 的 信息 资源 来 应 对 在 组 织 和 社会 中 面临 的 挑 
战 , 旨 在 塑造 信息 解决 方案 的 专家 。 这 说 明了 当下 教 
学 应 注重 合作 授课 ,增加 课程 内 容 的 丰富 性 和 创新 性 
才能 满足 对 信息 专业 人 才 日 益 增长 的 市 场 需求 。 

数据 可 视 化 和 演示 类 课程 中 独立 授课 的 包括 高 级 
数据 可 视 化 (Advanced Data Visualization ) 和 网 络 分 析 
( Network Analysis) ;合作 授课 的 包括 数据 可 视 化 (Data 
Visualization ) 和 数据 科学 故事 化 (Data Science Storytell- 
ing) 。 基 础 类 课程 大 多 由 多 名 教师 合作 完成 授课 , 进 
阶 类 课程 大 多 研究 领域 较为 专 深 , 故 由 该 领域 的 专家 
独立 授课 效果 更 佳 。 数 据 科 学 + 学 科 类 中 独立 授课 占 
比较 高 ,因为 该 大 类 数据 科学 课程 大 多 是 针对 茶 一 具 
体重 题 的 研究 和 探索 进行 介绍 ,实践 性 强 ,涉及 学 科 种 
类 和 Nj, 与 必修 课 、 基 础 课 相 比 学 生 受众 范围 较 小 。 如 数 
握 花 理 (Data Ethics ) 实用 健康 数据 分 析 (Practical 
Heaith Data Analytics ) 商务 分 析 ( 了 Business Analytics ) 
和 数字 人 文 (Digital Humanities) 等 。 
授课 内 容 分 析 
笔者 对 数据 科学 课程 群 中 所 有 课程 简介 的 内 容 进 
让 文 分 词 处 理 和 关键 词 词 频 初步 统计 ,删除 全 部 数 
词 、 副 词 .介词 .连词 等 无 实际 内 容 意 义 的 词语 , 仅 保留 
名 调动 词 和 其 他 专 有 名 词 等 ,根据 关键 词 权重 指标 
(Sre) 得 到 排名 前 十 五 的 关键 词 词汇 , 见 表 5。 关键 


频 察 和 关键 词 在 文章 中 与 其 他 词 的 语义 聚合 程度 等 决 
定 四 。 通 过 分 析 课 程 内 容 的 关键 词 词 频 ,笔者 发 现 现 
阶段 UIUC 数据 科学 课程 较 多 涉及 技术 ,可视化 .概念 
介绍 . 建 模 与 实践 应 用 ,数据 分 析 .结构 化 .探讨 学 习 、 
元 数据 .社交 媒体 ,数据 挖掘 等 重点 内 容 。 如 数据 可 视 
化 课程 概述 数据 可 视 化 的 历史 和 运用 的 现代 技术 ,这 
些 将 基于 定量 的 ,统计 的 和 以 网 络 为 中 心 的 数据 集 。 
课程 主题 包括 交流 可 视 化 的 建构 .可 视 化 的 现代 软件 
生态 系统 以 及 数据 统计 分 析 的 可 视 化 技术 ,尤其 是 关 
注 Python 生态 系统 和 多 维 定量 数据 集 。 社 交 媒体 分 析 
课程 主要 向 学 生 介绍 社交 媒体 分 析 的 基本 概念 .方法 、 
技术 和 应 用 ;培养 学 生 分 析 结构 化 和 非 结构 化 社交 媒 
体 数据 所 需 的 素养 和 技能 ,以 及 有 效 .负责 任 地 使 用 社 
交 媒体 分 析 的 策略 。 通 过 循序 渐进 的 指导 ,学 生 们 将 
完成 作业 任务 ,动手 练习 和 一 项 使 他 们 能 够 分 析 来 自 
各 种 现实 世界 平台 (例如 Twitter 和 维基 百科 ) 的 用 户 
生成 数据 的 项 目 。 


表 5 ”UIUC 数据 科学 课程 群 课程 简介 词 频 


序号 关键 词 词 频 权重 频率 ( % ) 
1 数据 68 1 0.139 630 4 
2 技术 17 0.824 3 0.034 907 6 
3 可 视 化 10 0.8142 0.020 533 9 
4 概念 12 0.796 2 0.024 640 7 
5 科学 11 0.7856 0.022 587 3 
6 模型 9 0.7756 0.018 480 5 
7 工具 10 0.775 3 0.020 533 9 
8 实践 9 0.7648 0.018 480 5 
9 理论 9 0.764 2 0.018 480 5 
10 数据 分 析 了 0.7477 0.014 373 7 
11 结构 化 6 0.746 2 0.012 320 3 
12 数据 科学 6 0.7304 0.012 320 3 
13 元 数据 6 0.730 4 0.012 320 3 
14 社交 媒体 5 0.710 4 0.010 2669 
15 数据 集 5 0.7104 0.010 2669 


为 进一步 探析 UIUC 信息 学 院 数 据 科 学 课程 群 中 
介绍 讲解 的 编程 语言 方法 工具 和 技术 应 用 领域 ,笔者 
从 调研 的 42 门 课程 简介 中 人 工 筛选 出 与 工具 \ 方 法 、 
编程 语言 .技能 类 等 相关 度 较 高 的 名 词 ,外文 字符 和 专 
有 词汇 为 关键 词 , 导 入 词 云 制作 软件 中 进行 直观 的 可 
视 化 演示 ,得 到 图 4。 关键 词 词 云 ,又 称 标签 云 ,是 以 
关键 词 字体 的 字号 大 小 .颜色 或 是 粗细 来 可 视 化 各 个 
关键 词 的 重要 程度 ,以 便于 读者 快速 把 握 文 本 信息 的 
重要 内 容 。 通 过 对 图 4 的 分 析 , 笔 者 发 现 UIUC 信息 学 
院 数 据 科 学 课程 群 十 分 关注 方法 、 工 具 、 编 程 语言 和 软 
件 等 技能 型 知识 的 讲授 与 实践 ,主要 包括 Python 语言 、 
R 语言 和 SQL( Structured Query Language ,结构 化 查询 
语言 ) 等 。 如 数据 科学 基础 (Foundations of Data Sci- 
ence) 首先 学 习 如 何在 Unix 命令 提示 符 下 工作 ,随后 
介绍 Python 编程 语言 ,重点 介绍 与 数据 科学 相关 的 语 
言 和 相关 Python 模块 的 特定 方面 。Python 将 主要 通 
过 IPython 或 Jupyter 笔记 本 进行 引入 和 使 用 ,并 将 涵 
盖 Numpy Scipy .MatPlotlib .Pandas ,Seabom 和 Scikit _ 
learn Python 模块 。 这 些 功能 将 通过 简单 的 数据 科学 
任务 (如 获取 数据 清理 数据 可视化 数据 和 基本 数据 
分 析 ) 进行 演示 。 商 务 分 析 课程 使 用 的 工具 主要 包括 
R MySQL 和 Tableau。 数 据 库 类 课程 要 求学 生 完 成 学 
习 任 务 后 精通 结构 化 查询 语言 (SQL ) 编写 基本 查询 语 
句 ,并 全 面 了 解 关 系数 据 库 理论 。 将 学 习 机 器 学 习 技 
术 , 包 括 监督 和 非 监 督学 习 、 尺 寸 缩减 和 群集 查找 。 重 
点 将 强调 这 些 技术 在 高 维 数值 数据 .时 间 序 列 数据 、 
像 数 据 和 文本 数据 方面 的 实际 应 用 。 最 后 ,学 生 将 学 
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习 使 用 关系 数据 库 和 云 计 算 软 件 组 件 ,如 Hadoop、 
Spark 和 NoSQL 数据 存储 。 


MySQL™ Un 到 
人 sala python 生命 周期 坊 .2 
1 政策 上 中 - 和 AS 全 
统计 学 中 业务 技 能 软件 Python 法 律 名 
标准 黄 外 一 一 于 工具 工具 隐私 通信 
EE ms » 网 ，| ,六 相 佳 
5 通信 软件 但 一 RR 
gy ONN 全 ,a 
a 研讨 会 中 2 全 SN 
# $3SQL SS 语言 a 到 中 
- WV / [i 语言 o a 世 过 [3 
入 。 数据 仓库 公 人 上 8 能 4 智能 电 
生命 周期 "于 I 民风 ws oo BG 从 
有 mu 机 器 商业 ， i 建 模 模式 Hodoop 
» par 


图 4 数据 科学 课程 群 应 用 领域 关键 词 


二 UIUC 信息 学 院 数据 科学 课程 除了 重视 方法 、 工 

具 < 乡 程 语言 等 技能 型 知识 的 学 习 ,还 加 强 了 对 git 和 
GDb 站 点 等 源 代码 管理 软件 的 学 习 。 此 外 ,这 些 技 
能 知识 涉及 的 应 用 领域 也 比较 广泛 ,包括 隐私 \、 通 
信 尚 业 ,法律 ,学术 研究 .图 书馆 、 医 疗 卫 生 ,政策 标准 
道德 素养 .社区 .地 理 等 。 结合 上 文 表 2, “数据 科学 
科 类 课程 占 全 部 课程 的 比例 最 高 也 在 此 得 到 验 
和 


@ 从 国内 外 数据 科学 类 岗位 的 招聘 要 求 和 相关 著名 


始 成 员 ,一 直 致 力 于 图 情 教育 发 展 。 面 对 科研 第 四 范 
式 带 来 的 机 遇 和 挑战 ,UIUC 已 开始 进行 数据 科学 相关 
课程 探索 。 本 文通 过 实地 学 习 和 网 站 调研 发 现 ,UIUC 
数据 科学 课程 可 分 为 六 大 类 ,面向 本 硕 博 各 阶段 学 生 ， 
采用 线 上 线 下 相 结合 的 混合 式 教学 方式 ,教学 内 容 紧 
密 跟随 数据 科学 岗位 市 场 要 求 。 大 多 数 类 别 课程 均 由 
教师 合作 授课 。 

目前 国内 数据 科学 教育 体系 与 课程 设置 尚 处 于 起 
步 阶段 ,发 展 不 成 熟 仍 有 许多 需要 提高 的 空间 。 本 文 
结合 上 述 对 UIUC 信息 学 院 数 据 科学 课程 建设 现状 的 
调研 ,从 培养 对 象 类 型 .授课 形式 授课 合作 程度 和 课 
程 内 容 4 个 方面 进行 了 归纳 整理 和 对 比分 析 , 并 针对 
当下 我 国 数据 科学 教育 面临 的 机 遇 和 挑战 提出 以 下 4 
点 建议 : 

(1) 强 化 我 国 数据 科学 课程 教育 的 连续 性 ,使 培 
养 对 象 履 盖 本 硕 博 各 阶段 。 经 过 广泛 调研 发 现 , 现 阶 
段 我 国 大 多 数 高 校 的 数据 科学 课程 教育 集中 在 本 科 阶 
段 ,硕士 研究 生 阶 段 的 培养 较为 初步 ,博士 研究 生 的 培 
养 更 是 少 之 又 少 。 如 5.1 所 述 ,UIUC 现 阶段 数据 科学 
硕士 课程 建设 和 培养 体系 较为 成 熟 ,博士 阶段 课程 采 
日 研 讨 会 的 形式 开展 ,本 科 阶 段 课程 仅仅 旨 在 为 部 分 
核心 专业 课 提供 良好 的 数据 库 理论 基础 , 仍 在 不 断 建 


| 


数据 科学 家 的 访谈 记录 中 可 总 结 出 ,数据 科学 类 岗位 
经 党 使 用 以 下 几 种 工具 *! :QR 、 Python、Haskell、 Clo- 
jscala 等 数据 科学 语言 工具 ;@NoSQL、MongoDB、 
Copel base 、Cassandra 等 NoSQL 工具 ; @ SQL、 DW、 
RIEES OLAP 等 传统 数据 库 和 数据 仓库 工具 ; 由 
HadaopHDFS&MapReduce .Spark 等 支持 大 数据 计算 的 
工具 ;@Pig .HBase Hive .Cascalog .Impala 等 支持 大 数 
据 管 理 . 存储 和 查询 的 工具 ; (@) Webscraper、Avro、 
Flume Hume 、Sqoop 等 支持 数据 和 采集、 聚合 或 传递 的 工 
具 ;(DPandas ,SciPy Weka Knime 等 支持 数据 挖掘 的 工 
具 ;(@Tableu .Gephi .Shiny .D3. js ,ggplot2 等 数据 可 视 化 
的 工具 ;ODSPSS .Matlab SAS 等 数据 统计 分 析 工 具 。 

可 见 ,UIUC 信息 学 院 面向 大 数据 时 代 的 数据 科学 
课程 建设 紧 跟 市 场 需求 变化 ,涉及 领域 广泛 ,紧密 关注 
数据 的 探索 和 准备 数据 转换 处 理 等 技术 .数据 计算 与 
建 模 工具 的 应 用 实践 以 及 数据 分 析 、 数 据 可 视 化 等 数 
据 技能 建构 ,为 全 面 培养 满足 社会 需求 的 专业 数据 人 
才 , 优 化 数据 科学 教育 提供 良好 的 支撑 。 


6 总 结 与 建议 


UIUC 作为 iSchools 核心 领导 小 组 (iCaucus ) 的 创 


设 完 善 中 。 因 此 ,未 来 国内 高 校 需 以 提供 覆盖 本 硕 博 
各 阶段 的 数据 科学 系统 教育 和 课程 建设 为 发 展 目标 。 

(2) 丰 寅 我 国 数据 科学 课程 教学 的 创新 性 ,使 混 
合式 教学 法 进一步 融入 国内 课程 教学 实践 。 如 5.2 所 
述 ,UIUC 信息 学 院 主要 采用 多 功能 的 Moodle 教学 管 
理 系统 , 据 了 解 2020 年 UIUC 将 升级 为 Z00M ,届时 功 
能 将 更 加 强大 。 现 阶段 国内 MOOC 等 平台 上 不 乏 优质 
精品 在 线 开 放 课 程 , 与 数据 科学 相关 的 课程 包含 中 
人 民 大 学 朝 乐 门 教授 的 数据 科学 导论 .北京 理工 大 学 
谨 天 教授 的 Python 数据 分 析 与 展示 等 。 利 用 MOOC 
改进 教学 ,尝试 开设 精品 在 线 课程 ,学 习 UIUC 信息 学 
院 将 课程 教学 管理 平台 融和 日常 教学 活动 , 仍 是 我 国 
高 校 未 来 需要 不 断 改 进 的 方向 。 

(3) 增 强 我 国 数据 科学 授课 教师 间 的 教学 合作 ， 
使 授课 合作 程度 进一步 深化 。 如 5.3 所 述 ,UIUC 信息 
学 院 数 据 科 学 课程 群 中 数据 探索 和 准备 类 课程 全 部 是 
合作 授课 ,并 且 该 校 数 据 科 学 课程 群 授课 教师 除了 来 
自传 统 图 书 情报 专业 ,部 分 教师 还 拥有 计算 机 科学 专 
业 背 景 和 图 书馆 数据 管理 业务 实践 背景 。 近 年 国内 各 
大 高 校 也 逐渐 将 图 书馆 员 请 进 课堂 ,共同 进行 教学 设 
计 完 成 教学 任务 ;但 院 系 内 部 任课 教师 间 的 教学 合 
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仍 有 待 加 强 , 师 资 引进 方面 也 需 增强 跨 学 科 视角 ,根据 
实际 业务 需要 聘用 复合 型 人 才 , 可 增加 兼职 教授 和 客 
座 教授 数量 。 

(4) 完 善 我 国 数据 科学 课程 研究 方向 ,使 课程 内 
容 紧 密 跟 随 市 场 需求 。 国 内 数据 科学 课程 大 多 以 计算 
机 科学 和 统计 学 为 背景 ,而 以 图 书馆 数据 实践 业务 . 医 
学 信息 分 析 业 务 等 为 主导 方向 的 课程 很 少 。 数 据 科学 
课程 对 于 数据 素养 能 力 提升 和 数据 思维 培养 ,以 及 大 
数据 时 代 新 兴 高 技能 知识 人 才 一 一 数据 馆 员 专业 性 的 
保障 都 具有 非 同 寻常 的 意义 。 如 5.4 所 述 , UIUC 
信息 学 院 数据 科学 课程 涉及 领域 广泛 ,紧密 关注 信息 
行业 图 情 领域 应 用 实践 和 数据 技能 建构 ,为 培养 专业 
数据 人 才 提供 了 良好 的 支撑 。 因 此 ,我 国 高 校 应 深入 
调研 国内 信息 市 场 岗 位 要 求 , 在 参考 国外 一 流 院 校 的 
优 知 课程 内 容 和 设计 基础 上 ,将 各 种 实用 工具 及 语言 
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Abstract: | Purpose/significance | This paper studied the current construction of data science curriculum 


2roups, focuses on the training program of data science talents and provides references and advice for the data science 


practice of information colleges in China. | Method/process | Based on the data science curriculum practice of UIUC 


iSchool, this paper first investigated the name and introductions of the data science-related courses in detail, academ- 


ic hours, teaching forms, the teachers and the subjects, then systematically classified the course groups and made a 


detailed comparative analysis from the 4 aspects: training object type, teaching forms, teaching cooperation degree, 


and the course content. Finally, this paper summarized the enlightenments and suggestions for the development of da- 


ta science education in China in light of the current domestic situation. | Result/conclusion | In UIUC iSchool Data 


science courses can be divided into 6 categories, which are suitable for students at all stages. A mixed teaching meth- 


0 combining online and offline is adopted. Teachers cooperate with each other and the contents closely follow the da- 


,science job market requirements. Finally, the authors suggest that we should strengthen the continuity of cultiva- 


Giign, innovate teaching methods, improve teaching cooperation, and enrich research directions in the field of data 


Sr"” in China. 
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